Comment: Schon Recht Anspruchsvolle Algorithmen, Laufzeitanalyse Inklusive Comment: Ein Guter Artikel, Um Einen Ersten Eindruck Vom Themengebiet \data Mining" Zu Bekommen. 2 Cheung*97:maintenance]

نویسندگان

  • Rakesh Agrawal
  • Tomasz Imielinski
  • Mihael Ankerst
  • Daniel A. Keim
چکیده

Dieser Artikel zeigt, da Assoziationsregeln fast immer in einem einzigen Scan der Datenbank gefunden werden konnen. Dies wird durch einen randomisierten Ansatz erreicht. Original-Abstract: Discovery of association rules is an important database mining problem. Current algorithms for nding association rules require several passes over the analyzed database, and obviously the role of I/O overhead is very signi cant for very large databases. We present new algorithms that reduce the database activity considerably. The idea is to pick a random sample, to nd using this sample all association rules that probably hold in the whole database, and then to verify the results with the rest of the database. The algorithms thus produce exact association rules, not approximations based on a sample. The approach is, however, probabilistic, and in those rare cases where our sampling method does not produce all association rules, the missing rules can be found in a second pass. Our experiments show that the proposed algorithms can nd association rules very e ciently in only one database pass. [wrobel98:wissensentdeckung] Stefan Wrobel. Data Mining und Wissensentdeckung in Datenbanken. KI, KDD Sonderausgabe 1:6{10, 1998. Location: Uni-Bonn, Bibliothek, Readers: bertram, Date: 16.06.1998, Schlagworte Data Mining, KDD, Maschinelles Lernen, Verfahren, Anwendungen, Forschungsfragen, Abstract: Eine Einf uhrung in das Gebiet des Knowledge Discovery und DataMining, Comment: hat noch gar nix speziell mit WebMining zu tun, wirklich f ur den Einstieg [wu93:hcv] Xindong Wu. The HCV Induction Algorithm. In Proc. 21st ACM Computer Science Conferences, pages 169{175, 1993. [wu95:knowledge] Xindong Wu. Knowledge Aquisition from Databases. Ablex Publishing Corp USA, 1995. [wulfekuhler*97:salient] M. R. Wulfekuhler and W. F. Punch. Finding salient features for personal web page categorization. In Proc. of 6th International World Wide Web Conference, 1997. [zaiane*95:resource] O. R. Zaiane and J. Han. Resource and knowledge discovery in global information systems: A preliminary design and experiment. In Proc. of the First International Conference on Knowledge Discovery and Data Mining, pages 331{336, 1995. [zaki*96:evaluation] Mohammed Javeed Zaki, Srinivasan Parthasarathy, Wei Li, and Mitsunori Ogihara. Evaluation of Sampling for Data Mining of Association Rules. In 7th International Workshop on Research Issues in Data Engineering (RIDE'97), Birmingham, UK, May 1996. URL: ftp://ftp.cs.rochester.edu/pub/papers/systems/ 97.RIDE.Eval of sampling for data mining of assoc rules.ps.gz Location: Internet Readers: pa haus Date: 28.04.1998

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Tinkering with Noise: Wie man neue Musikinstrumente technisch m¨oglich macht

Technologie ermöglicht es uns neue Wege zu finden Musik zu machen. Hier kann man verschiedene Ansätze wählen. Entweder man verwendet etablierte Technologien oder man Versucht neuartiges technologisch zu ermöglichen. Die Technologie ist aber nie Selbstzweck sondern eine notwendige Bedingung um für den Menschen interessante Musikinstrumente zu gestalten. In diesen Artikel möchte ich die Gelegenhe...

متن کامل

Klein, Aber O

Drei Semester sind schon wieder ins Land gegangen seit meinem ersten Aufruf zu mehr Sorgfalt beim Verwenden mathematischer Symbole. Es war natürlich nur ein Tropfen auf den heißen Stein. Noch immer kann die Einstellung ” Das wollen wir jetzt mal nicht so genau nehmen.“, zu deutsch: ” Korrekte Schreibweisen würde doch sofort jeder verstehen!“, einen großen Fanclub um sich vereinen. Es ist also a...

متن کامل

Das Schülerlabor als Ort der Informatiklehrerbildung

Im Artikel wird anhand der internationalen Diskussion über Lehrerausbildung und mithilfe des Ansatzes der Phänomenographie ein Konzept zur Integration von Schülerlaboren in die Informatiklehramtsbildung vorgestellt, um so die Praxisbezüge der ersten Phase der Lehrerausbildung zu stärken. Gleichzeitig werden Grundlagen gelegt, um durch einen ‚forschenden Blick„ auf Unterricht Kompetenzen zur Pla...

متن کامل

UX - Schnell und effektiv mittels 5-Sekunden-Test

Ein 5-Sekunden-Test ist ein einfaches und schnelles Verfahren um den ersten Eindruck einer Webseite oder App zu testen. In einer Studie haben wir mit 123 Studierenden verschiedene Varianten des 5Sekunden-Tests durchgeführt. Aus den gewonnenen Erfahrungen ziehen wir die Erkenntnis, dass ein 5Sekunden-Test die erste Wahrnehmung effizient misst und somit eine sinnvolle Erweiterung im Repertoire ei...

متن کامل

Der gläserne Landwirt

Landwirtschaft und elektronische Überwachung haben nur auf den ersten Blick wenig miteinander zu tun; Landwirtschaft hat auf der einen Seite schon längst einen hohen Automatisierungsgrad erreicht und ist in der Informationsgesellschaft angekommen; elektronische Überwachung setzt längst nicht mehr voraus, dass die erhobenen Daten automatisiert vorliegen. Der Bereich der Landwirtschaft ist wegen ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2007